ChatGPT al descubierto: Mitos y realidades de la IA generativa

Una ilustración futurista y minimalista de una silueta humana frente a una representación abstracta y brillante de una IA, con burbujas de texto flotando entre ellos. La IA se representa como una red de nodos interconectados. El fondo muestra sutilmente código binario y ecuaciones matemáticas. Utiliza una paleta de colores fríos con azules y morados (diseño del prompt hecho por Claude para ilustrar esta entrada).

Descubre cómo funciona ChatGPT, desmiente mitos sobre la IA generativa y aprende cuándo es mejor usar un buscador o una IA en tu día a día.

Si has leído mis posts anteriores sobre los conceptos básicos de inteligencia artificial o los peligros reales que conlleva, ya tendrás una idea general sobre el tema. En esta entrada, vamos a profundizar en el funcionamiento de la IA generativa para despejar algunas dudas comunes.

¿Qué es realmente ChatGPT?

Aunque a menudo uso el término ChatGPT para referirme a la IA generativa en general, es importante aclarar que ChatGPT es una aplicación de chat específica. Esta aplicación permite a los usuarios interactuar con una IA generativa basada en un modelo de lenguaje grande (LLM, por sus siglas en inglés).

ChatGPT está desarrollado por OpenAI, la empresa detrás de los modelos GPT (Generative Pre-trained Transformer). Estos modelos se identifican con números de versión, como GPT-4o, que es la versión más reciente al momento de escribir este post.

Desmintiendo mitos sobre ChatGPT

Antes de explicar cómo funcionan las IA generativas, aclaremos algunas creencias erróneas sobre ChatGPT que también se aplican a otros modelos como Gemini, Llama o Claude:

MITO: ChatGPT sabe hacer de todo

Realidad: GPT es un modelo de IA débil, especializado en comprender y generar lenguaje natural. Para tareas como la generación de imágenes, se apoya en otras IAs especializadas (por ejemplo, DALL-E).

MITO: ChatGPT y otras IA generativas son conscientes, tienen emociones o son capaces de entender el mundo de la misma manera que un ser humano.

Realidad: Aunque las IA generativas pueden imitar conversaciones humanas y generar contenido coherente, no tienen conciencia, emociones o entendimiento real. Solo procesan grandes cantidades de datos y utilizan modelos predictivos para generar respuestas basadas en patrones.

MITO: La IA reemplazará a los humanos en campos creativos como la escritura, el arte y la música, haciendo obsoleta la intervención humana.

Realidad: Aunque la IA es capaz de generar contenido creativo, su papel es más de apoyo o herramienta complementaria. Las ideas originales, la interpretación y el contexto cultural siguen siendo dominios humanos donde la IA tiene limitaciones significativas.

MITO: ChatGPT y otras IA generativas siempre ofrecen información exacta y confiable.

Realidad: Las IA generativas pueden generar información incorrecta o imprecisa, ya que no comprenden el contexto o la veracidad de los datos que procesan. La calidad de las respuestas depende de los datos con los que fueron entrenadas y no pueden hacer distinciones éticas o científicas sobre la información.

MITO: Las IA como ChatGPT aprenden de las interacciones individuales con los usuarios y mejoran a partir de esas conversaciones.

Realidad: ChatGPT no tiene memoria personal a largo plazo ni puede aprender de interacciones directas. Cada conversación es independiente, y no se acumula conocimiento entre sesiones. ChatGPT puede "recordar" preferencias dentro de una conversación, pero esto no implica aprendizaje real. Y es posible que OpenAI monitorice las conversaciones y recopile información de las interacciones para analizarlas a posteriori y mejorar el modelo en su nueva versión, pero eso no es aprender en tiempo real.

MITO: Cualquier persona, independientemente de sus conocimientos técnicos o contextuales, puede utilizar herramientas de IA como ChatGPT para solucionar problemas complejos de forma automática.

Realidad: Aunque ChatGPT es una herramienta accesible y útil, su uso eficaz en problemas complejos requiere conocimientos en la materia para poder formular las preguntas correctas y evaluar las respuestas generadas. Sin una guía adecuada, la IA puede proporcionar soluciones erróneas o poco útiles.

MITO: La IA generativa es completamente imparcial, ya que solo se basa en datos.

Realidad: La IA está influenciada por los sesgos presentes en los datos con los que fue entrenada. Por tanto, puede generar respuestas con sesgos preexistentes o, en algunos casos, reflejar inequidades o prejuicios de los datos utilizados en su entrenamiento.

MITO: Las herramientas como ChatGPT no tienen implicaciones en términos de privacidad o seguridad, ya que no recopilan datos sensibles.

Realidad: Aunque ChatGPT no almacena información personal directamente, el uso descuidado de la herramienta (compartir datos personales, información sensible) puede tener implicaciones de privacidad si no se manejan adecuadamente.

Curiosidad:

La imagen que ilustra esta entrada de blog, como en la mayoría de mis publicaciones, ha sido generada por DALL-E utilizando la herramienta Microsoft Designer (anteriormente conocida como Bing Image Creator). Para evitar cualquier duda, siempre incluyo una marca indicándolo. Aunque la IA crea la imagen, el concepto siempre ha sido mío, ya que yo escribía el prompt. Sin embargo, en esta ocasión, el prompt lo ha generado Claude, la IA con la que he estado conversando. Le proporcioné el contenido de la entrada y le pedí que generara un prompt adecuado para DALL-E que ilustrara el contenido. Juzga tu mismo el resultado.

¿Cómo genera ChatGPT sus respuestas?

Los modelos de IA generativa no están programados con respuestas predefinidas. En su lugar, utilizan modelos matemáticos para predecir la palabra más adecuada en cada paso de la respuesta. Este proceso se repite, añadiendo cierto grado de aleatoriedad, lo que explica por qué pueden generar respuestas variadas a una misma pregunta.

Por ejemplo, ante la pregunta "¿Cuál es el mejor color?", ChatGPT podría generar respuestas como:

"El mejor color es subjetivo; varía según gustos y situaciones."
"No hay un mejor color, depende de cada persona."
"El mejor color depende de ti."

Respuestas dadas por ChatGPT ante la pregunta repetida 3 veces de cuál es el mejor color.

Curiosidad:

ChatGPT para producir la respuesta completa a la pregunta de cuál es el mejor color, lo hará palabra a palabra.

Elije una primera palabra "el"
Predice qué palabra encaja mejor a continuación de "el" y pone "mejor"
Una vez que tiene "el mejor" predice que encaja "color"
y así sucesivamente hasta que tiene "el mejor color depende de ti"

Es decir, en este caso la respuesta ha sido fruto de 6 predicciones de palabras, una a una. Y este proceso de generación de las respuestas parece que difiera bastante de nuestro proceso de pensamiento, pero los resultados son espectaculares.

Fuentes de información para el entrenamiento de ChatGPT

Según OpenAI, el modelo GPT se ha entrenado con:

Información pública accesible en Internet
Información de terceros con licencia
Datos de entrenamiento proporcionados por los desarrolladores

OpenAI afirma haber respetado las leyes y evitado el uso de información protegida por derechos de autor o no pública, aunque este es un tema complejo y debatible.

Algunos de los problemas a los que se enfrentan los desarrolladores de estos modelos en relación a las fuentes de datos son:

Escasez de datos de alta calidad: Los LLM requieren enormes cantidades de datos textuales de diversas fuentes (libros, artículos, sitios web, etc) Sin embargo, no todos los datos son de alta calidad o útiles para el entrenamiento. Hay una gran cantidad de contenido redundante, irrelevante o incorrecto, desactualizado o no representativo que puede reducir la efectividad del modelo. Este problema se ha agravado últimamente porque cada vez más contenido de Internet está siendo generado por IA.
Problemas de sesgo en los datos: Los conjuntos de datos utilizados para entrenar los LLM pueden contener sesgos inherentes relacionados con género, raza, religión, cultura o cualquier otro aspecto sociocultural. Esto sucede porque los datos provienen de fuentes como internet, donde esos sesgos están presentes.
Cuestiones de propiedad intelectual y derechos de autor: Muchos datos textuales de alta calidad están protegidos por derechos de autor (por ejemplo, libros, artículos científicos o contenidos periodísticos).
Escasez de datos especializados: Mientras que los LLM tienen acceso a grandes cantidades de datos generales de la web, puede haber escasez de datos en dominios altamente especializados como la medicina, la ciencia o la ingeniería.
Dificultad para acceder a datos en otros idiomas: El acceso a datos de calidad en idiomas distintos del inglés puede ser limitado, especialmente para lenguas menos comunes o con menos contenido digitalizado. Esto puede impactar en la coherencia y precisión de las respuestas en esos idiomas.
Datos que se vuelven irrelevantes con el tiempo: Con el rápido cambio en la información y los hechos, algunos datos utilizados para entrenar los modelos se vuelven rápidamente obsoletos o inexactos. Esto afecta la precisión de los LLM en temas actuales, y los desarrolladores deben actualizar periódicamente los modelos para asegurar que generen respuestas correctas y actualizadas.

¿Cuándo usar un buscador y cuándo una IA generativa?

"Si todo lo que tiene es un martillo, cualquier cosa que vea le parecerá un clavo."

Observación de Baruch (del libro “La ley de Murphy”)

Con la llegada de las IA generativas, surge la duda de cuándo es mejor usarlas en lugar de un buscador tradicional. Aquí algunas directrices:

Usa un buscador para:
- Resultados deportivos actuales
- Recetas de cocina confiables
- Previsiones meteorológicas
- Noticias recientes
Usa una IA generativa para:
- Análisis de información sobre un tema
- Generación de ideas creativas
- Resúmenes y síntesis de información
- Explicaciones detalladas de conceptos complejos

En general, para información real y actualizada, los buscadores siguen siendo la mejor opción. Para tareas que requieren procesamiento de información, generación de contenido o análisis, las IA generativas pueden ofrecer mejores resultados.

Curiosidad:

Recomiendo que los resultados de deportes se consulten en un buscador y en la medida de lo posible no se consulten en ChatGPT porque es bastante fácil que sufra lo que se llama una alucinación y se invente el resultado. Os dejo aquí un ejemplo. Le pregunté por el resultado de la vuelta ciclista a España de 1905 y su respuesta fue concisa y clara, la ganó el ciclista español Lorenzo Aparicio.

Respuesta de ChatGPT a la pregunta de quién ganó la vuelta ciclista a España de 1905.

No me sonaba, así que lo busqué en un buscador y no encontré ni rastro. Después miré en la wikipedia la historia de la vuelta ciclista a España y encontré que la primera se disputó en 1935.

Extracto de la Wikipedia en la que se habla de la primera edición de la vuelta Ciclista a España de 1935.

Conclusiones

La IA generativa, ejemplificada por ChatGPT, representa un avance significativo en la forma en que interactuamos con la tecnología. Aunque estas herramientas son impresionantes, es crucial entender sus limitaciones y usarlas de manera apropiada.

Puntos clave a recordar:

Las IA generativas no aprenden en tiempo real durante las conversaciones.
Son excelentes para tareas de lenguaje, pero tienen limitaciones en otras áreas.
Generan respuestas prediciendo palabras, lo que explica su variabilidad.
Su entrenamiento se basa en grandes cantidades de datos públicos y licenciados.
Son complementarias, no sustitutivas, de los buscadores tradicionales.

¿Qué opinas sobre el uso de la IA generativa en tu día a día? ¿Has tenido experiencias interesantes usando ChatGPT u otras herramientas similares?

Comparte tus pensamientos en los comentarios y no olvides estar atento a mis nuevas publicaciones todas las semanas.

IA al alcance de todos